时政
财经
科技
虚拟货币
其他
登录
#tool calling
关注
九原客
6天前
Kimi官方对OpenRouter上不同的供应商的 Tool Calling能力做了Benchmark,发现有些供应商提供的模型服务有较大问题。 可能是推理Bug,也可能是不合理的量化。 另外 1. 使用的2000条Tool Calling 测试集没有开源。 2. 可以在 OpenRouter配置中排除掉某些供应商。
#Kimi
#Openrouter
#tool calling
#Benchmark
#模型问题
分享
评论 0
0
yetone
2个月前
用 claude-sonnet-4、gemini-2.5-pro、gpt-4o 分别锐评了 anthropic 和 openai 的官方 Go SDK 的 tool calling 哪个好,这三个模型一致认为 anthropic 的设计得好
Google Gemini 2.5发布引发AI模型性价比热议· 204 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 524 条信息
#Go SDK
#tool calling
#Anthropic
#OpenAI
#模型评估
分享
评论 0
0
yetone
3个月前
俺也一样,尤其是支持 tool calling 以后,才发现大多数 provider 的 API 标准都是屎
#tool calling
#provider API
#标准
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞